#!/usr/bin/perl
use strict;
use utf8;
use Encode;

#my $input;
my $output;

#$input = shift @ARGV || die $!;
$output = shift @ARGV || die $!;

#open(IN,$input);
open(OUT,">$output");

binmode(STDIN, ":encoding(utf-8)");
#binmode(STDOUT, ":encoding(utf-8)");
binmode(OUT, ":encoding(utf-8)");


$/ = "\n\n\/news\/";#дробим str по такому разделителю
#$/ = "\nhttp:\/\/lenta\.ru\/news\/";#для нашего тестового корпуса
#$/ = "-----------------\n";#для корпусов типа 2,3,4
while(my $str = <STDIN>){
	if ($str !~ /\s[Мм]ини-футбол|\s[Вв]ело|\s[Мм]ото|\s[Дд]воебор|\s[Тт]роебор|\s[Пп]ятибор|\s[Пп]о\sпрограммиров|\s[Кк]иллометр|\s[Гг]орнолыж|\s[Мм]огул\s[Дд]опинг|\s[Аа]рест|\s[Бб]окс|\s[Тт]расса|\s[Тт]анц|\s[Гг]онщик|\s[Тт]еннис|\s[Бб]иатлон|\s[Лл]ыж|\s[Рр]алли|\s[Аа]втогон|\s[Бб]олид|\s[Шш]ахмат|\s[Фф]игурист|\s[Ээ]стафета|\s[Аа]втомоб|\s[Пп]лавание|\s[Мм]арафон|\s[Мм]асс-старт|\s[Гг]андбол|\s[Гг]ольф|\s[Бб]ейсбол|\s[Мм]ногобор|\s[Пп]арашют|\s[Гг]имнаст|\s[Сс]ноуборд|\s[Фф]ристайл/){
		print OUT $str;
	}
}


close OUT;

